Techniques d'Apprentissage par Renforcement pour le Routage Adaptatif dans les Réseaux de Télécommunication à Trafic Irrégulie
نویسنده
چکیده
The aim of this thesis is to propose an algorithmic approach, which allows to treat the problems of adaptive routing (AR) in telecommunication networks with irregular traffic. The analysis of the existing approaches has lead us to base our work on the Q-Routing (QR) algorithm. This algorithm uses a reinforcement learning technique which is based on Markov models. The efficiency of these routing approaches depends on information about the network load and the nature of data flows. This information must be sufficient and relevant and it has to reflect the real network load during the decision making phase. To overcome drawbacks of techniques using QR, we have proposed two AR algorithms. The first one, which is called Q-Neural Routing, is based on a stochastic neural model, used for parameter estimation and updating required for routing. In order to reduce the convergence time, a second approach is proposed: k-Shortest path Q-Routing. It is based on a multi-paths routing technique combined with the QR algorithm. In this case, the exploration space is limited to k-Best paths. The proposed algorithms are validated and compared to traditional approaches using the OPNET Simulator. Their efficiency, with respect to AR, is illustrated. In fact, these algorithms allow taking into account the network state in a better way than the classical approaches do.
منابع مشابه
Performance Analysis of a Dynamic Compact Multicast Routing Scheme
Les algorithmes de routage compact ont pour objectif de trouver le meilleur compromis entre le nombre de bit mémoire nécessaire pour stocker les entrées des tables de routage et le coût des chemins de routage que ces algorithmes produisent. Dans cet article, nous présentons un algorithme de routage compact permettant la construction dynamique de chemins de routage point-à-multipoint pour la dis...
متن کاملLink scheduling and multi-path routing in wireless mesh networks. (Ordonnancement des liens et routage de multiple chemins pour les réseaux maillés sans fil)
Résumé Nous présentons des solutions algorithmiques pour deux problèmes liés à l’interférence de réseau sans fil. D’abord on propose de ordonnancer les liens d’un ensemble de routes données en vertu de l’hypothèse d’un modèle à fort trafic. Nous considérons un protocole TDMA qu’offre une source d’intervalles de temps synchronisés et cherchent à ordonnancer les itinéraires des liens afin de maxi...
متن کاملUne approche multi-agent adaptative pour la simulation de schémas tactiques
Résumé. Ce papier est consacré à la simulation ou à la réalisation automatique de schémas tactiques par un groupe d ́agents footballeurs autonomes. Son objectif est de montrer ce que peuvent apporter des techniques d'apprentissage par renforcement à des agents réactifs conçus pour cette tâche. Dans un premier temps, nous proposons une plateforme et une architecture d'agents capable d'effectuer d...
متن کاملColoration de nombre de Grundy pour les graphes triangulés
Notre travail s’intègre dans la problématique générale de la stabilité du réseau ad hoc. Plusieurs, travaux ont attaqué ce problème. Parmi ces travaux, on trouve la modélisation du réseau ad hoc sous forme d’un graphe (les machines correspondent aux nœuds, les arrêtes correspondent aux liens entre les machines). Donc le problème de stabilité du réseau ad hoc qui correspond à un problème d’alloc...
متن کاملFiltrage bayésien de la récompense
Résumé : Une large variété de schémas d’approximation de la fonction de valeur a été appliquée à l’apprentissage par renforcement. Cependant, les approches par filtrage bayésien, qui se sont pourtant montrées efficaces dans d’autres domaines comme l’apprentissage de paramètres pour les réseaux neuronaux, ont été peu étudiées jusqu’à présent. Cette contribution introduit un cadre de travail géné...
متن کامل